Nature系列 | 整合单细胞转录组学和质谱流式确定类风湿性关节炎滑膜组织中的炎症细胞状态 | 详细解读
To define the cell populations that drive joint inflammation in rheumatoid arthritis (RA), we applied single-cell RNA sequencing (scRNA-seq), mass cytometry, bulk RNA sequencing (RNA-seq) and flow cytometry to T cells, B cells, monocytes, and fibroblasts from 51 samples of synovial tissue from patients with RA or osteoarthritis (OA). Utilizing an integrated strategy based on canonical correlation analysis of 5,265 scRNA-seq profiles, we identified 18
unique cell populations. Combining mass cytometry and transcriptomics revealed cell states expanded in RA synovia: THY1(CD90)+HLA-DRAhi sublining fibroblasts, IL1B+ pro-inflammatory monocytes, ITGAX+TBX21+ autoimmune-associated B cells and PDCD1+ peripheral helper T (TPH) cells and follicular helper T (TFH) cells. We defined distinct subsets of CD8+ T cells characterized by GZMK+, GZMB+, and GNLY+
phenotypes. We mapped inflammatory mediators to their source cell populations; for example, we attributed IL6
expression to THY1+HLA-DRAhi fibroblasts
and IL1B
production to pro-inflammatory monocytes
. These populations are potentially key mediators of RA pathogenesis.
Zhang F, Wei K et al. Defining inflammatory cell states in rheumatoid arthritis joint synovial tissues by integrating single-cell transcriptomics and mass cytometry. Nat Immunol. 2019 May 6. doi: 10.1038
文章解读:Tiger
文章校对:生信宝典
研究背景
类风湿性关节炎(RA)是一种自身免疫性疾病(最近nature发表多篇),在关节组织的滑膜中具有慢性炎症。这种炎症导致关节破坏,残疾和寿命缩短。因此,在炎症组织中寻找关键细胞亚群及其活化状态是定义RA新治疗靶标的关键步骤。先期研究已经发现CD4 + T细胞
,B细胞
,单核细胞
和成纤维细胞
已确定与RA
发病机理相关。
作者收集和分解来自RA和OA患者的组织样本,然后对组成细胞进行质谱流式,普通流式,scRNA-seq和bulk RNA-seq。 通过在单细胞层面对跨数据模态进行整合,精确定义了特定细胞亚群在RA和慢性炎症中的作用。
研究方案
Sample:滑膜组织,作者招募了36名RA患者,15名OA患者,并从超声引导下的活检中或关节置换获得滑膜组织.
单细胞建库流程+实验设计流程:CEL-Seq2 method (下图)
测序数据分析介绍(质谱流式+Bulk RNA-seq+scRNA-seq)
质谱流式+Bulk RNA-seq
对流式分选的细胞(T cells, B cells, monocytes, and synovial fibroblasts)进行转录组测序;(工具:Illumina MiSeq ;比对:Ensembl version 83 transcripts; 39个转录组分析工具,120种组合评估(转录组分析工具哪家强-导读版))
QC:(1)定义共同基因为在
95%
的样品有至少一条reads支持;(2)共同基因占比少于99%
的样本定义为低质量样本在后续分析中将被剔除;共获得
167
个高质量样本,包括45
fibroblast samples,46
monocyte samples,47
T cell samples, and29
B cell samples;生信宝典注:质谱流式细胞技术(Mass Cytometry)是利用质谱原理对单细胞进行多参数检测的流式技术。它继承了传统流式细胞仪的高速分析的特点,又具有质谱检测的高分辨能力,是流式细胞技术一个新的发展方向。
scRNA-seq
方法:CEL-Seq2; 工具:HiSeq 2500;Reads 通过STAR2.5.2b比对到
hg19
;(基因组版本有些老,NGS基础 - 参考基因组和基因注释文件)QC:作者发现由少量reads表示的分子更可能是来自其他细胞的污染物分子,所以开发了一种简单的算法来设置每分子最小读数的阈值。We used
2
marker genes expected to be exclusively expressed in each of the four cell types:PDGFRA and ISLR
for fibroblasts,CD2 and CD3D
for T cells,CD79A and RALGPS2
for B cells, andCD14 and C1QA
for monocytes. 然后计算这些基因在该表达的细胞类型中的高于阈值的表达定义为真阳性,在不该表达的细胞类型中的高于阈值的表达定义为假阳性。遍历表达阈值分别为1-20
之间的数值,选取能够最大化真阳性/假阳性比值的值为最终阈值。然后作者进行以下条件的筛选:(1)细胞检测到的genes数>1000
;(2)线粒体相关基因的表达占比少于25%
;
质谱流式+scRNA-seq
作者收集6个富含白细胞、9个白细胞缺乏的RA和11个OA样品用于质谱流式分析;
双门控通道选定活细胞:B细胞(CD45 + CD3-CD14-CD19 +),成纤维细胞(CD45-PDPN +),单核细胞(CD45 + CD3-CD14 +)和T细胞(CD45 + CD3 + CD14-);
作者基于CCA分析整合转录组数据和单细胞数据,开发一种基于图的无偏聚类pipeline对单个细胞进行分析;
质谱流式分群
25161
fibroblasts,15298
monocytes,19985
T cells and8179
B cells;分别将质谱流式分群和bulk RNA-seq, scRNA-seq进行关联分析。
结果分析
(1)细胞分群及数据整合;作者利用流式对细胞进行分群后,以bulk RNA-seq作为reference point,利用CCA找到大量RNA-seq样品和scRNA-seq细胞的线性组合,以创建最大相关的基因表达谱。作者使用来自scRNA-seq的最佳标记基因与CCA结果关联,以建立每个scRNA-seq簇与每个质量细胞计数簇之间的关系;(不同测序数据整合分析可能会成为以后分析的一种趋势,nature methods最近发表多篇)
Krenn inflammation score
(一种炎症评价指标) 对切片上的炎症状态进行评估;
生信宝典注:马氏距离 (Mahalanobis distance
)是由印度统计学家马哈拉诺比斯 (P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是,它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的),并且是尺度无关的(scale-invariant),即独立于测量尺度。
(3)单细胞分析揭示不同细胞亚型;在5,265
个细胞中发现1,142 B cells
, 1,844 fibroblasts
, 750 monocytes
and 1529 T cells
(作者在这里说明传统基于PCA的分类batch effect较为明显,所以作者采用CCA-based clustering), 作者共分出来18 cell clusters
; 成纤维细胞中,鉴定了四个亚群:CD34 +亚细胞成纤维细胞
,HLA-DRAhi成纤维细胞
,DKK3 +成纤维细胞
和CD55 +lining成纤维细胞
; 在单核细胞中, 作者鉴定了IL1B +促炎单核细胞,NUPR1 +单核细胞,C1QA +单核细胞和干扰素(IFN)活化的单核细胞;在T细胞中,鉴定了三个CD4 +簇:CCR7 + T细胞,FOXP3 +调节性T细胞(Treg细胞)和PDCD1 + TPH和TFH细胞;三个CD8 +簇:GZMK + T细胞,GNLY + GZMB +细胞毒性淋巴细胞(CTL)和GZMK + GZMB + T细胞。在B细胞内,鉴定了四个细胞簇,包括幼稚IGHD + CD27-和IGHG3 + CD27 +记忆B细胞,具有高表达ITGAX
(也称为CD11c)的自身免疫相关B细胞(ABC)簇和具有高免疫球蛋白基因表达和XBP1的浆母细胞簇;(作者的细胞分型是比较符合免疫分型的,大家也可以采用以上marker对免疫细胞进行亚分型,不建议完全参照某一篇文章定义所有细胞分型)
作者发现富含白细胞的RA滑膜与OA相比具有更大的IL1B +单核细胞和IFN激活的单细胞丰度,但更低NUPR1 +单核细胞的丰度。这些数据表明细胞因子激活驱动活动性RA滑膜中独特单核细胞群的扩增。利用基因组富集分析(GSEA),作者测试了MSigDB(分子特征数据库)免疫基因组,发现IL1B +单核细胞(SC-M1)脂多糖反应相关基因的表达水平相对较高;(一句话,单核细胞异质性较强)
CD4 +
和三个CD8 + T
细胞亚群(其实作者分出的亚群CD4比较好分,CD8多为exhausted T cell耗竭性基因的表达)鉴定了三个CD4+
簇:CCR7 + T细胞,FOXP3 +调节性T细胞(Treg细胞)和PDCD1 + TPH和TFH细胞; 三个CD8 +
簇:GZMK + T细胞,GNLY + GZMB +细胞毒性淋巴细胞(CTL)和GZMK + GZMB + T细胞。与OA相比,CXCL13
在富含白细胞的OA的TPH
细胞中上调表达; 作者通过质谱流式,鉴定出9个T cell clusters, 并通过结合bulk seq发现CXCL13, TIGIT and CTLA4
在CD4+PD-1ICOS+cluster中富集;
(8)通过单细胞分析揭示炎症途径和效应模块; 为了确定与富含白细胞的RA相关的途径,作者使用GO分析鉴定了I型干扰素反应
和炎症反应
(单核细胞和成纤维细胞),Fc受体信号传导
(单核细胞),NF-κB信号传导
(成纤维细胞)和干扰素γ(T细胞)。富含白细胞的RA样本在成纤维细胞和单核细胞中具有显着更高的基因表达:炎症反应基因(PTGS2,PTGER3和ICAM1),干扰素应答基因(IFIT2,RSAD2,STAT1和XAF1),以及趋化因子或细胞因子基因(CCL2和CXCL9),与干扰素激活的协同趋化反应一致。 T细胞具有干扰素调节因子(IRF)的上调,包括IRF7和IRF9,并且单核细胞具有IRF7,IRF8和IRF9的上调。Toll样受体信号通路富含白细胞丰富的RA组织中的B细胞和单核细胞。
在单细胞水平,TLR10
仅由活化的B细胞表达,表明TLR10在B细胞谱系中具有功能性作用。相反,TLR8
在所有RA单核细胞亚群中升高。造血细胞特异性转录因子IRF8在显着部分的单核细胞和B细胞中表达,其协同调节RA滑膜中单核细胞和活化B细胞的分化。 SLAMF7由促炎单核细胞(SC-M1),IFN激活的单核细胞(SC-M4),CD8 + T细胞和浆母细胞(SC-B4)高度表达。
临床意义
(1)该篇文章强调可以将sublining fibroblast
作为治疗RA的潜在靶点;(a major source of proinflammatory cytokines)
(2)第一次在富含白细胞的RA中发现自身免疫相关性B细胞;
单细胞文章点评
该文章的亮点在于多种维度的数据进行整合分析,并且开发了CCA-based pipeline
, 对每个细胞分群描述的极为详细,符合《nature immunology》一贯“又细又长”的风格;
炎症反应的单细胞方面的文章还处于较少的阶段,该文章做的是类风湿关节炎,还有许多的自身免疫病可以以相同方式进行实验(最关键的是样本获取和money),尤其是有一些自身免疫病可以引发癌症的(前几天有篇胃炎胃癌的单细胞测序)。
炎症反应和病原体结合的文章较少,合理设计实验很重要!
(+reporter对病原体进行标记)可以发现病原体和机体的动态互作;
必须将scRNA seq与其它技术进行结合(现在主要是质谱流式和CRISPR),除非你的细胞数真是巨多(我是土豪!)
单细胞系列教程
参考文献
Zhang F, Wei K et al. Defining inflammatory cell states in rheumatoid arthritis joint synovial tissues by integrating single-cell transcriptomics and mass cytometry.Nat Immunol. 2019 May 6. doi: 10.1038
易生信系列培训课程,扫码获取免费资料
更多阅读
后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集